مدلسازی وابسته به متن در بازشناسی گفتار پیوسته بر اساس در خت تصمیم گیری آوایی فارسی

نویسندگان

seyed hosein shams

amirkabir university of technology seyed mohammad ahadi

amirkabir university of technology

چکیده

مدلسازی وابسته به متن به عنوان شیوه ای مفید برای افزایش دقت مدلسازی در بازشناسی گفتار پیوسته مورد توجه است. معمولترین شکل پیاده سازی این شیوه، استفاده از مدلهای سه آوایی است. با این همه، تعداد زیاد این مدلها موجب می شود که در عمل، آموزش سیستم با مشکلات زیادی همراه باشد و دستیابی به آموزش مقاوم (robust training) به سختی میسر گشته یا اصولا مقدور نشود. یکی از شیوه های حل این مشکل، استفاده از روش گره زدن (tying) پارامترها است. در این مقاله خوشه بندی (clustering) برای پارامترهای حالت مدل hmm صورت گرفته و حالتهای قرار گرفته در خوشه با یکدیگر گره زده شده اند تا در کل سیستم، تعداد پارامترها کاهش یافته و آموزش مقاوم حاصل شود. دو نوع دسته بندی یکی بر اساس پارامترهای مدلهای نهایی آموزش دیده و فاصله بین آنها و دیگری به کمک داده های آموزشی و بر مبنای درخت تصمیم گیری انجام شده است. در پیاده سازی روش اخیر به طراحی درخت تصمیم گیری بر اساس ویژگیهای آکوستیکی آواها در زبان فارسی و شباهتها و تفاوتهای آنها اقدام شده است. نتایج بدست آمده، موفقیت آمیز بودن هر دو روش را تایید کرده است. با این حال، مزیت روش دوم در امکانپذیر ساختن تخمین پارامترهای مدلهای دیده نشده است.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

مدلسازی تنوعات تلفظی آوایی به منظور ایجاد واژگان پویای تطبیقی در سیستم بازشناسی گفتار پیوسته

در این رساله به ارائه روشهایی برای مدلسازی تلفظ در واژگان برای بهبود عملکرد سیستم بازشناسی گفتار پیوسته پرداختیم. تلفظ تحت تاثیر عوامل متعددی از جمله عوامل وابسته به گوینده و مستقل از گوینده می باشد. این عوامل می توانند موضعی و فرا موضعی باشند. بخشی از تحقیق حاضر به بررسی آماری میزان و نحوه تاثیر این عوامل از جمله نرخ بیان، احتمال وقوع کلمه، جایگاه هجا در کلمه، موضع تکیه در کلمه روی تلفظ در گفت...

15 صفحه اول

بازشناسی احساس از روی گفتار پیوسته فارسی

در سالهای اخیر بازشناسی احساس به عنوان روش جدیدی برای تعامل انسان با کامپیوتر مورد توجه و موضوع تحقیقات زیادی بوده است. احساس، در قالب حرکات چهره، گفتار، حرکات دست و بدن و علایم زیستی مانند ضربان قلب بروز می یابد. مدل پیشنهادی در این پایان نامه از گفتار پیوسته فارسی برای بازشناسی احساس استفاده می کند. بازشناسی احساس از گفتار بر روی زبان های مختلفی انجام شده اما بر روی زبان فارسی تا کنون این چن...

بازشناسی گفتار پیوسته فارسی به کمک شبکه های عصبی

گفتار محصول سیستمهای تولید و درک گفتار و مغز انسان است . انسان همیشه از طریق گفت و شنود توانسته است ارتباط بهتری با محیط خود برقرار کند. بنابراین اگر بتوان از کامپیوتر بصورت سمعی و بصری بهره گرفت ، تحول بزرگی در استفاده از آنها بوجود می آید. در این پروژه، بمنظور طراحی روشهایی در بازشناخت گفتار پیوسته فارسی، شبکه های عصبی بعنوان ابزار مدلسازی انتخاب شده اند. در بخش نخست اجرای پروژه، با هدف دستیا...

15 صفحه اول

بازشناسی گوینده وابسته به متن

دراین تحقیق طراحی و بکارگیری سیستمهای بازشناسی گوینده ارائه شده است. بازشناسی گوینده، استفاده از یک ماشین جهت بازشناسی یک شخص از یک عبارت بیان شده است. این سیستمها می توانند به دو روش عمل کنند : شناسایی یک شخص بخصوص یا تآیید ادعای شخص مدعی، شناسایی یک شخص با استفاده از ویژگیهای فیزیکی از قبیل گفتار، نمونه ای از اهمیت تجاری در زمینه امنیتی است. بازشناسی گفتار یک روش شناسایی شخص، مبتنی بر استخراج...

15 صفحه اول

پایه‌گذاری بستری نو و کارآمد در حوزه بازشناسی گفتار فارسی

Although researches in the field of Persian speech recognition  claim  a  thirty-year-old  history in Iran  which has achieved considerable progresses, due to the lack of well-defined experimental framework, outcomes from many of these researches are not comparable to each other and their accurate assessment won’t be possible. The experimental framework includes ASR toolkit and speech database ...

متن کامل

رتبه‌بندی واج‌های گفتار فارسی از نظر کارآیی در بازشناسی گوینده

در این مقاله، کارآیی واج­های گفتار فارسی از نظر بازشناسی گوینده مورد مطالعه و پژوهش قرار گرفته و با توجه به میزان کارآیی­ها، رتبه­بندی واج­ها صورت گرفته‌اند. جهت برآورد کارآیی واج­ها، از یک معیاری که به­صورت نسب « فاصلة بین­گوینده­ای» واج­ها به « فاصلة در گوینده‌ای» تعریف شده است و ما آن را « نسبت تأثیرپذیری گوینده » نامیده­ایم، استفاده شده است.­ آزمایش­ها و محاسبات لازم برای کلیه واج­های گفتار...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید


عنوان ژورنال:
مهندسی برق مدرس

جلد ۳، شماره ۱، صفحات ۴۳-۵۶

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023